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Beschreibung 

Die Erfindung betrrfft ein Verfahren zur definierten Verknupfung doppelheitkater DNA-Fragmento fiber 
kohasive Enden mit den im Anspruch 1 angegebenen Merkmalen. Die Erfindung betrifft weiterhin eine 
5 doppelheNkale Unker-DNA der im Anspruch 1 angegebenen Formel I, in der R 1 . R 2 , X und n wie oben definiert 
sind. Das Verfahren bzw. die Linker-DNA der Erfindung kann fur eine gezielte Veranderung des Erbmaterials 
verwendet werden. 

Rest riktions- Linker sind bekannt (Scheller et al., Science Bd. 196, (1977), 177 und werden se'rt langem in der 
Molekularbiologte und Gentechnologie verwendet Ihnen ist gemeinsam, da& die Erkennungsregion fur die 
10 Restriktionsendonuclease im zentrelen Teit der Oligonucleotidsequertz liegt und in der Regel im 5' - und 3'- 
endstandigen Bereich von G/C-reichen Sequenzen flankiert wird. Im folgenden werden zwei Betspiete fur 
bekannte Linker-Sequenzen gegeben: 



Eco Rl-Unker: d(GGAATTCC) 
15 Bam Hl-Unker: d(CGGATCCG) 

Die Nachteile dieser Linker sollen im folgenden an einem Beispiel erlautert werden. Nach Ligation dieser 
Linker an DMA mit Hilfe von T4-Po!ynucleotidligase wird durch diese Linker das Erbmaterial (DNA) 
unweigerlich und irreversibel verindert, da nach dem "Serine! den" mit der entsprechenden 
20 Restriktionsendonuclease (gegebenenfalls nach erfolgter Klonierung etc.) auch nach Anwenden eirter 
einzelstrangspezifischen Endo-/Exonuclease, ein Teil der angekoppelten Linkernucleotide an der DNA 
verbletben: 

25 



5 1 GGAATTCC 

1 . DNA ////// + 
30 3 * CCTTAAGG 

T4-Ligase 



! 



35 



5 ' GGAATTCC 

40 1 . DNA //777 

3 ' CCTTAAGG 

Eco RI-Endonuc lease 

45 



I 



50 5' GG AATTC 3' 

1 . DNA ///// + /// 2. DNA 

3' CCTTAA G 5' 



55 



I T4-LJ 



60 



65 
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5* GGAATTC 3' 

1 . DNA ///// /// 2. DNA" , 

5 3' CCTTAAG ^ 
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1 . Klonierung 

2. Eco RX-Endonuc lease 



5' G G 

1 . DNA ///// 
3 f CCTTAA 

I Nuclease 



3° 5 ' GG 

1 . DNA ///// 
3' CC 



35 



40 



45 



Es wird deutlich, daS bei diesem Beisptel gem a 6 dem Stand der Technik die ursprungtiche DNA urn 2 GC- 
Basenpaare verlangert wurde. 

Die Nachteile des bekannten Verfahrens k&nnen mlt dem Verfahren bzw. der Unker-DNA der Erfindung 
vermleden warden, da &Je ermoglfchen, die ursprungliche Erbinformation in unveranderter Weise 
55 zuruckzugewinnen. Die Merkmate des Verfahrens der Erfindung ergeben sich a us dem kennzeichnenden Teil 
des Anspruchs 1. 

Der hier verwendete Begriff 'komplementar" bedeutet komplementar fm Sinne von Watson und Crick. 
"Spiegelbildlich komplementar" bedeutet daft zwei Sequenzen komplementar sind, wenn die eine von links 
nach rechts und die andere von rectus nach links gelesen wird. 
60 Die Oligonucleotide 1 weisen normalerweise ebenso wie die ersten und zweiten DNA-Fragmente am 5' 
-Ende eine Phosphatgruppe auf; fehlt dtese am Otigonucleotid I. 1st ledigltch dafur zu sorgen, da6 das 1. bzw. 
2. DNA- Fragment an der Verknupfungsstelle fur die Linker-DNA eine 5'-standige Phosphatgruppe aufweist. 
Fehlt die Phosphatgruppe im ersten oder zweiten DNA-Fragment, muS das Oligonucleotid I eine 5'- 
Phosphatgruppe aufweisen. 

65 Wenn Ri eine der durch Kombination der vier Nucleotide A, T, C und G moglichen, nicht in sich selbst 
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komptementaren Tetranucleottdsequenzen ist ergeben sich die aus Ta belle 1 ersichtlichen Sequenzen. Wenn 
R 1 eine der durch Kombination der vier Nucleotide A, T, C und G moglichen, nicht in sich selbst 
komplementaren Pentanucleotide ist (in Anbetracht der ungeraden Nucleotidzaht sind 
Pentanucleotidsequenzen ausschlieBlich nicht in sich selbst komptementar), erhatt man durch analoge 
5 Permutation die hier im einzelnen nicht wiedergegebenen moglichen Sequenzen, z. B. 

(6')AAAAA(3') 
AAAAT 

10 



15 GGGGC 

GGGGG 

SinngemSB konnen auch durch entsprechende Permutation die Kombinationsmoglichkeitan fur in sich selbst 
oder nicht in sich selbt komplementare Hexanucleotide aus den Nucleotiden A r T, C und G erhalten warden, z. 
20 B. 



25 



30 



35 



(5')AAAAAA(3') 
(5')AAAAAT(3'J 
AAAATT 
AATTTT 



GGCCCC 
GGGGCC 
GGGGGC 
GGGGGG 



Fur die hier angesprochenen Falle, daB R 1 eine nicht in sich selbst komplementare Tetra- oder Penta- oder 
eine in sich oder nicht In sich selbst komplementare Hexanucleotidsequenz ist, gilt, daft R 2 die zu R 1 
spiegelbildtich komplementare Sequenz mit gleicher Kettenlange aufweissen muB, z, B. 

40 

(5*)ACTA(X) n TAGT(3') 

(5')CACACA(X) n TGTGTG(3 J ) 

(5)AAATTT(X) n AAATTT(3') 

45 Weiterhin girt fur diese Falle, daft entweder R 1 oder R 2 ein einzlges Ribonucleotid enthaiten muB, und zwar In 
den endstSndigen Posrtionen 3' oder 5', oder gegebenenfalts auch X ein 3'- oder B'-endstandiges Ribonucleotid 
enthalt. z. B. 

(5')C W ACAGC*TGTG(3'). 

50 

wobei R 1 - CACA, R 2 - TGTG und X - GC* bedeuten und die Ribonucleotide durch * markiert sind. 

Es girt die Regel. daB zur Erzeugung kohSsiver Enden in dem Spacer X ein Ribonucleotid vorhanden sein 
muB, wenn entweder R 1 oder R 2 ein Ribonucleotid aufweisen; ein Ribonucleotid im Spacer X ist dagegen nicht 
erf ordertich, wenn R 1 und R 2 je ein Ribonucleotid enthatten. 
55 Es ist jedoch auch moglich, daB R 1 und R 2 5'- oder 3'-standige Ribonucleotide enthaiten, wobei die jeweitige 
Positionierung des Ribonucleotids bestimmt welche Kettenlange das ubertragene kohasive Ende aufweist. 

Weiterhin gilt, daB T* (Ribothymidin) durch das gleichwirkende U* (Ribouridin) ersetzt sein kann. 

One AufzShlung und Beschreibung von Restriktionsendonucteasen der Klassen II und III ist in der 
Firmenschrrft "Restriction Endonucleases" der Boehringer Mannheim GmbH, 1981, enthaiten; diese 
60 Ver6ffentlichung enthaJt auch Restriktionsendonucteasen der Klessen II und III, die fur das Verfahren der 
Erfindung verwendbar sind, in der fotgenden Beschreibung jedoch nicht namentllch genannt werden. 

Mit dem Verfahren der Erfindung lessen sich 1, 2, 3, 4, 5 oder 6, vorzugswetse 4, Nucleotide aufweisende 
kohdsive Enden auf die erste DNA ubertragen, wobei Nucleotide aus der Spacer-Gruppe X nicht mit 
ubertragen werden. Es ist jedoch auch moglich, wie spater an einem Beispiel gezeigt wird, aus dem Spacer X 
65 ein oder mehrere Nucleotide mit auf die erste DNA zu ubertragen, und zwar bei geetgneter Positionierung 
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eines Ribonucleotids in der Gruppe X. 

Die Ausbildung der kohdstven Enden an der 1. DNA erfolgt durch Spaltung des bus der 1. DNA und der 
Unker-DNA erhaltenen Reaktionsproduktes, das in allgemeiner Schreibweise wie im Schema I dergestellt 
warden kann (am SchluB der B each rei bung). 
5 Im Schema 1 bedeutet N die die Reste R 1 bildenden Nucleotide A, T, G und/oder C bzw. A*, T\ G\ C" 
und/odar U\ und X die oben definierte Oligonucieotidgruppierung mit 2-30 Nucleotideinheiten. Weiterhin 
sind mit Pfeilen die Spattungsposrtionen gemaB vier Spattungsva riant en a, b, c und d dargestellt, auf die im 
folgenden eingegangen wird. 

10 

Varlanten a, b: 

Die Spaltung erfolgt mittels Restriktionsendonucleasen der Klassen II bzw. til und fuhrt zu der Ausbildung 
IS eines kohasiven Endes an der Fremd-DNA, das die gleiche Nucteotidzahl aufweist wie die Gruppe R 1 bzw. R 2 
der Linker-DNA. Je nach Spezifitat der Endonuctease wird das kohdsive Ende am 5-' oder 3*-Ende der Fremd- 
DNA erzeugt. 



20 

Variant en c, d: 

Die Spaltung erfolgt mittels Basen bzw. RNA-sen, setzt somit voraus, daB an den Spaltungspositionen 
Ribonucleotide A*, T\ C\ G* oder U* vorhanden sind. wobei zu beachten ist, daB die Spaltung immer am 3*- 

25 Ende des Ribonucleotids erfolgt. Je nach Position ierung der Ribonucleotide wird das kohasive Ende am 5'- 
oder 3'-Ende der Fremd-DNA erzeugt; weiterhin bestimmt die Positionierung der Ribonucleotide die 
Kettenlange (1 - 6) des ubertragenen kohasiven Endes. Das kohasive Ende kann ausschlieBlich aus den 
Nucleotide n der Gruppen R 1 und R 2 stammen; es konnen jedoch zusatzlich noch Nucleotide aus der 
Spacerregion ubertragen werden. 

30 GemaB einer wetteren vortellhaften AusfOhrungsform der Erfindung kann man das eln kohfisives Ende 
eufweisende, erste DNA-Fragment vor der Verknupfung mit dem zweiten DNA-Fragment mit einer an sich 
bekannten, kohasive Enden unterschiedlicher Restriktionsspezifizitat aufweisenden Adapter-DNA umsetzen. 
Auchfur dtese Variante wird spater noch ein Beisptel gegeben. 
Das Verfahren der Erfindung wird im folgenden anhand von bevorzugten Beispielen naher erlautert. 

35 Wenn in den Oligonucleotiden der allgemeinen Formel I R 1 und R 2 Sequenzen der aligemeinen Forme! II 
bedeuten, d.h. z, B. die zentrafe Erkennungsregion von Restriktionsendonucleasen der Klassen I! und III, und 
(X)„ eine kurze Spacerregion darstellt. lassen slch mit diesen Oligonucleotiden mit Hilfe von Ugasen, 
insbesondere T 4 -Polynucleotidligase Erkennungsregionen fur Restriktionsendonucleasen in genetisches 
Material (DNA) einbauen. Dabet gestatten es die Oligonucleotide der Formel I, daB nach erfolgter Kopptung 

40 und Klonierung die ursprungliche Erbinformation in unveranderter Form zunlckgewonnen wird. Dies wird 
• dadurch erreicht, daB sich die den kohasiven Teil besnhaltende Signalsequenz der Restriktionsendonuciease an 
den beiden Enden des Oligonucleotids befindet. 

Das folgende Beispiel 1 verdeutlicht die Vortesle, die mit ein em OHgonucleotid der Erfindung der Formel d- 
(AATTGGAATT) erreichbar sind. 

45 



SO 5* G AATTCGAATT 

1, DNA//7 ♦ 
3 1 C TTAAGCTTAA 



55 

T4-Ligase 
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5 9 GAATTCGAATT 

i . dna"77 

3 ' CTTAAGCTTAA 



1 



5' G 

i . dna/77 

3 1 CTTAA 



Eco RI-Endonuclease 



AATTC 3 ' 

772 . DNA 
G 5" 



1 



T4-Ligase 



5 1 GAATTC_ __ 

1 .DNA// / / / / 2 - DNA 

3' 



CTTAAG 



3' 
5' 



| 1 .Klonierung 

1 2. Eco RI-Endonuclease 



5 f G 

1 . DNA/77 
3 ' CTTAA 



Nuclease 



40 5' G 

TTDNA/// 

3« C 

45 Es wird deutlich, daft mit dem Verfahren bzw. dem Oligonucleotid der Erfindung die Erbinformation (1. DNA) 
nach Kopplung dersalben mit dem Oligonucleotid der Erfindung bzw. der Linker-DNA, Spattung unter 
Erzeugong eines kohasiven Endes, Kopplung an etne zweite DNA (Vektor-DNA) mit einem komplementaren 
kohasiven Ende, Klonieren, erneute Spattung und Abspaftung des kohasiven Endes in unveranderter Form 
zuruckerhatten wird. 

50 ' Die Hnfuhrung End o nuclease -spezifisc her kohasiver Enden gema& der Erfindung hangt vom endstandtgen 
Basenpaar der ersten DNA ab. Einige Beispiele fur die vier moglichen Basenkonstellationen sollen das 
Verfahren der Erfindung weiterhin ertautern: 



55 



60 



Belspiel 2 

5 ' G 

1. DNA///7 



65 



Oligonucleotide 1: 



AATTCGAATT (Signalsequenz fur Eco Rl) 
GATCCGGATC (Slgnalsequenz f Or Bam HI) 
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Beiapiel 3 

10 5 i A 

1. DNA//// 
31 T 



GTACCGGTAC (Signalsequenz fur Kpn I) 
TCGACGTCGA (Signalsequenz fur Sal I) 
AGCTCGAGCT (Signalsequenz fur Sac !/Sst I) 



15 



20 



Oligonucleotide I: 



GATCTAGATC (Signalsequenz fur Bgl II) 
TCGATATCGA (Signalsequenz fur Cla I) 
AGCTTAAGCT (Signalsequenz fur Hind HI) 
AATTTAAATT (Signalsequenz fur Aha III) 



25 



30 



35 



Belspiel 4 

5' C 

1. DNA/777 
3 1 G 

Oligonucleotide I: 



TGCAGCTGCA (Signalsequenz fur Pst I) 
GATCGCGATC (Signalsequenz fur Pvn I) 
TCGAGCTCGA (Signalsequenz fur Xho I) 



Belspiel S 

40 

5» T 

1. DNA/ / / / * 
3* A 

45 

Oligonucleotide I: GATCATGATC (Signalsequenz fur Bel I) 

GTAGATCTAG (Signalsequenz fur Xba I) 

50 Fur die Beispiele 1 - 5 ist die Kenntnis des endstandigen Basenpaares der ersten DNA (Fremd-DNA) 
erforderiich. Demgegenuber genOgt fur einige Restriktionsendonucleasen das Vorhandensein der selbst 
komplementaren Tetranucleotidsequenz, so daft diese Linker gemSB dem Verfahren der Erfindung fur jede 
Fremd-DNA verwendet werden kdnnen, gleichgultig, welches endstandige Basenpaar dort vorliegt, d.h. nach 
Ankopptung einlger der Oligonucleotide der Erfindung wird immer das kohSeive Ende der entsprechenden 

55 Restrictions endonuclease erzeugt. Im folgenden werden hierf Or einige Beispiele gegeben. 



60 



65 
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Belsplel 6 



* 5' N 

1. DNA/ } I i f 
3' N« 

Oligonucleotide I: GATCCGGATC (Signalsequenz for Mbol /Sau 3 A) 

70 TCGAGCTCGA (Signalsequenz fur Taq I) 

AATTCGAATT (Signalsequenz fur Eco Rl # ) 
AGCTCGAGCT (Signalsequenz fur Alu I) 



75 
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50 
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50 



N tst eines der Nucleotide A, C. G und T; N' bedeutet das jeweils dazu komplementare Nucleotid A, C, G und 

T. 

Im folgenden wird ein Beispie! fur den Einsatz eines Oltgonucleotids gegeben, in dem R 1 eine Sequenz der 
Formel III und R 2 eine Sequenz der Formel IV mit den dort angegebenen Definitionen fur A, C, G und T bzw. A\ 
C\ G" und T* sowie N und N' bedeuten, wobei die Sequenzen von R 1 und R 2 , von links nach rechts gelesen, bis 
auf die zueinander komplementaren Nucleotide N und N', identisch sind. 



Beispiel 7 

5' G 

1. DNA///// 
3' C 

Oligonucleotide I: GTCACCGGTGAC (Signalsequenz fur Bst Ell) 

Falls aufgrund des gegebenen endstandigen Basenpaares der Fremd-DNA nicht direkt die gewunschten 
kohasiven Enden erzeugt werden konnen, getingt dies in einem zwischen den Spaltungs- und 
Verknupfungsschritt eingeschalteten zusatzlichen Verfahrensscbrrtt. Im nachfolg enden Beispiel 8 besitzt die 
erste DNA (Fremd-DNA) ein endstdndiges GC-Basenpaar, so dafc die fur Hind III spezifischen kohdsiven Enden 
nicht direkt eingefuhrt werden konnen. Es wird daher zunachst der Bam Hl-Linker und danach eine Bam Ht- 
/Hind lll-Adapter-DNA verwendet, um das gewunschte Ziel zu erreichen (Adapter-DNA kann als kurze DNA mit 
kohasiven Enden unterschiedlicher Restriktionsspezifitat definlert werden): 



Beispiel 8 

45 5 1 G GATCCGGATC 

1 - DNA//77 + 
3 1 C CTAGGCCTAG 



1 . T4-Ligase 

2 . Bam HI * Endonuc lease 



5 1 G GATCCCGGGTA 

1. DNA//// + 
3 ' CCTAG GGCCCATTCGA 



i 



T4-Ligase 



5 1 G GATCCCGGGTA 

1. DNA//// 
65 3 1 CCTAG GGCCCATTCGA 
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Eine Verfahrensfuhrung gemaB Beispiel 8 ermoglicht letztlich die Einfuhrung jedes kohisiven Endes 
unabhgngig davon, welches endstindige Basenpaar die erste DNA tragt, wobei entsprechend dem 
erfindungsgemaBen Konzept die erste DNA unverandert zuruckerhalten werden kann. 

GemaB einer wefteren Variante des Verfahrens bzw. der Oligonucleotide der Erfindung konnen an 
5 definterten Positionen des Oligo nucleoids Ribonucleotide eingebaut werden. Erfindungsgema& konnen die 
Restriktiortsendonuclease-spezrfischen kohdsiven Enden auch ohne Verwendung der Restriktionsendonuclease 
eingofuhrt werden. Dies wird an den folgendcn Beispieten 9 und 13 erlautert. 



10 



15 



20 



25 



SO 



35 



40 



Beispiel 9 



Kohasives Ende fur Eco Rl: 



A* ATTGC * AATT 



3 . 1 - . DWA/// ^ + TT AA*CGTT A* A 



I 



1 .T4-Ligase 
2.0H~ 



5' GA* 

1. DNA//// P 
3 f CTTAA 



1 . Phosphatase 

2. J0 4 - 

3 . Phosphatase 



5' G 

1. DNA/ 777 

3* CTTAA 



i 
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50 
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Bolspiel 10 



10 
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20 



25 



30 



35 
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KohSsives Ends fur Pst I: 

5» C TGCAG*CTGCA* 

1, DNA//// + 

3< q A*CGTCG*ACGT 



i 



1 . T4-Ligase 

2. OH~ 



5 1 CTGCAG* 

1. DNA//// P 
3' : G 

1 . Phosphatase 

2. J0 4 - 
y 3. Phosphatase 



CTGCA 



K DNA//// 
3' G 



50 



In den Beispielen 9 und 10 werden, ebenso wie in der folgenden Beschreibung, Ribonucleotide durch * 
gekennzeichnet 

Durch den Einbau eines Ribonucteotids wird innerhatb der DNA eine definierte alkalilabile Position 
geschaffen, wie sich aus dem folgenden Reaktionaschema ergibt: 

0 OH 0 CH HO 0P0 3 H" 

0=P-0" 0 = P-0" 

1 I * b 
0 s OH HO-^G^ 



55 Dabei verbfeibt der Phosphatrest der Internucleotidbindung am Ribonucleotid. Nach Behandlung mit 
Phosphatase wird eine 2\ 3'-cis-Diolgruppierung geschaffen, die durch Perjodatbehandlung in bekannter 
Weise gespalten und ebenf alls in bekannter Weise unter milden alkalischen Bedingungen zur Eliminierung des 
Ribonucteotids fuhrt. Zum SchluB wird durch erneute Phosphatasebehandlung das 3'-terminale 
Desoxyribonucteotid f reigesetzt. Es kann vorteilhaft sein, diesen Schritt erst spator in einer Reaktionssequenz 

60 durchzuf uhren, um dieses kohasive Ende durch den 3'-Phosphatrest "geschutzt" zu behalten. 

Ein weiterer Vorteil dieser Verfahrensvanante Hegt darin, daB die Ribonucleotidposrtionen so gewShlt 
werden kSnnen, daB Jewells nur einer der beiden DNA-Strange eine definierte alkalilabile Bruchstelte erhalten, 
bzw. der jeweits endere Strang durch die entsprechende Restriktionsendonuclease geschnhten werden kann. 
Dies wird im folgenden an zwei Beispielen erf autert: 

65 
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10 



OH" spaltbar 
G A* ATTC GAATT 



K DNA//// 
31 c T TAAGCTTAA* 

t 

enzyinatisch spaltbar 



15 



20 



25 



Beiepiel 12 



enzyinatisch spaltbar 



5 ' G AATTC G * AATT 

1, DNA//// 
3' C TTAA* GCTTAA 

OH - spaltbar 
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Das Verfahren der Erfindung ermoglicht auch die Einfuhrung von kohasiven Enden, die nicht selbst 
komplementar sind. In diesem Falle 1st R 1 eine nicht in sich selbst komplementSre Tetra- oder 
Pentanucleotidsequenz oder eine in sich sefbst oder nicht in sich selbst kompfementare Hexanucleotidsequenz 
der Formel V, V) bzw. VII gemaB dem Hauptanspruch (mit den dort angegebenen weiteren Deftnitionen); R 2 ist 
stets eine zu R 1 spiegelbildlich komplement&re Sequenz gleicher Lange mit 4, 5 oder 6 Nucleotides Wie weiter 
oben ausgefuhrt wurde, weist R 1 und/oder R 2 ein 5'- oder 3'-endstandiges Ribonucleotid auf, wobei 
gegebenenfatls tn dern Spacer (X) n ein weiteres Ribonucleotid vorzusehen ist. 

In Abhingigkeit davon, wo die Ribonucleotide positioniert sind, kann - bei gleicher Nucleotidsequenz - die 
lange des kohasiven Endes beeinftu&t warden und das kohasive Ende entweder an das 3'- oder 5' Ende der 
ersten DNA (Fremd-DNA) dirigiert werden. 

Die folgenden Beispiele erlautem diese Verfahrensvariante: 



Beispieltt 



5' 



1. DNA///7 



C*ACAGC*TGTG 
GT GTC * GACAC * 



50 



1 . T4-Ligase 

2. Phosphatase 

3. Perjodat 

\^ 4. Phosphatase 



55 



1 . DNA/777 
3 1 GTGT 



60 
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Befspiel 14 



5 1 I DNA/ /77 
3" 



C*ACAG*CTGTG 
GTGTCG*ACAC* 



10 



15 



1. DNA//// 
3* GTGTC 



1 • T4-Ligase 

2 . Phosphatase 

3 . Per jodat • 
n> 4. Phosphatase 



20 



25 



Beispiel 15 



30 



35 



C DNA///7 



CACAG * CT GTG * 
* GT GTCG * ACAC 

1 . T4-LIgase 

2 . Phosphatase 
^ 3. Per jodat 

4 . Phosphatase 



5 1 CACA 

1. DNA/ 777 
3 4 ! 



Beispiel 16 

5' CACAGC*TGTG* 

1. DNA//// + 
3' * GTGT * CGACAC 

1. T4-Ligase 

2. Phosphatase 

3. Per jodat 

^ 4. Phosphatase 

5 ■ CACAG 

1. DNA/ 777 
3' 



Durch geeignete Positionierung der Ribonucleotide ist auch bei dieser Verfahrensvariante moglich, die 
alkalilabile Bruchstelle in jeweils nur einem der beiden DNA-Stange einzufuhren. Dies ermdglicht z. B. bei 
ringformiger, doppetstrangiger, entweder die Isolierung des Minus-oder des Pius-Stranges. 
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Das fotgende Beispiel verdeutlicht, daS mit Otigonucleotiden I, in denen R 1 und R 2 in sich selbst oder nicht in 
sich selbst komplementare HexanucJeottdsequenzen sind, kohasive Enden erzeugt werden konnen, die, in 
Abhangigkeit von der Position terung von Ribonucleotiden in den Resten R 1 , R 2 bzw. X, KetteniSngen von t - 6 
Nucleotfden aufweisen. 



Beispiel 17: 

10 t ^ mmA n w ^ c * ACACAGC * T GT GT G OrT v /o^.nMai 

(Fremd-DNA) gtgtgtc *ga C ACAC* * (Fremd-DNA) GTGTGT 



IS /p Mm * nwa i C*ACACAGCT*GTGTG 
(Fremd-DNA) GTGTGT * C GACACAC* 



OH 



•> (Fremd-DNA) 



GTGTG 



20 (Fremd-DNA) 



C * ACACAGCTG *TGTG 
GTGTG*TCGACACAC* 



OH 



(Fremd-DNA) 



GTGT 



etc . 



25 



,~„ m o nwa i * C AC AC AGCTGTGT * G OH „ , 

(Fremd-DNA) GT * GXGTCGACACAC * > (Fremd-DNA) Q 

30 

Die vorsteh enden Beispiele offenbaren die gro&e Flexibility des Verfahrens der Erfindung, das immer dann 
von Vorteit 1st, wenn DNA-Fragmente irreversibet mitetnander verkoppeft werden sollen oder wenn sich die 
Anwendung von Restriktionsendonucteasen verbietet, weil das Vorhandensein interne r Signatsequenzen sehr 
35 wehrscheiniich ist. Dies ist bei hochmoiekularen DNA-Fragmenten, z.B. zur Etabiierung einer Genbank, fast 
immer der Fall. 

Der in dem OUgonucleotid der Formel I enthartene Spacer (X) n stelft kurze Oligonucleotidsequenzen dar, die 
els notwendiger Spacer unter Berucksichtlgung der fur die Restriktionsendonuclease-Erkennungsregion 
notwendigen Nucleotide und der erforderlictten Stability t der durch Selbstkomplementarrt§t sich bildenden 
40 doppelstrSngigen DNA ausgewShlt wird. Wird die zentrale Tetranucleotidsequenz nur durch die wenig 
Stabilitat vermrttelnden AT-Basenpaare gebiidet, wie z.B. beim Eco Rl-Unker 

d(AATTCGAATT) 

45 so kann die Stabilitat z.B. durch VerlSngerung des Spacers erhoht werden, z. B. 

d ( AATTCG CGAATT) . 

Dadurch kann erne weitere Erkennungsregion fur eine Restriktionsendonucteese eingef uhrt werden, z. B. fur 
X — CCCGGG hat der Eco Rl-Unker die Formel 

50 

Xmal Smal 
d (AATTCCCGGGAATT) 

Hier wird nicht nur mit dem Linker die Eco Rl-Signatsequenz in eine Fremd-DNA eingefuhrt, die GC als 
55 endstSndiges Basenpaar besitzt, sondem auch noch die recht seltene Erkennungseequenz fur Smal/Xmai. 

Das folgende Ausfuhrungsbeispief betrlfft die Herstellung und erfindungsgema&e Anwendung etnes 
Oligonucleotide der Erfindung der Formel d(GATCCGGATC). 



60 

Beispiel 18 

Herstellung von d(GATCCGGATC) (vgl. Tetrahedron Let. 1983. 747) 

100 mg C-Tr§ger (10 uMol N-benzoytiertes C. kovalent gebunden an "Controlled Pore Glass" (CPG), werden 
65 nacheinander mit je 100 uMol der durch MSNT (1,5 Aquivalente/PO-) aktivierten N-geschOtzten, 5'- 
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dlmethoxytritylierten Desoxynucleosid-3'-(2-chlorphenyl)-phosphodiester T, A, G, G, C, C, T, A und G 
umgesatzt. Ein Reaktionszyklus umfaBt Kondensation (45') in Pyridin, Waschen mit Pyridin, Capping mit 
EssigsSureanhydrid/Pyridin (W). Waschen mit Pyridin, CM 2 Ct 2 /MeOH (7 : 3) und Abspalten der 
Dimethoxytritylgruppe mh gesattigtem ZnBr 2 In CHjCI^Methanol (7 : 3) fur 10' und Waschen mit Ch^CI^MeOH 
5 (7:3) sowie Pyridin. 

Die durchschnittlichen Kondensationsausbeuten liegen bei 90 -95 <Vb. 

Nach der letzten Kondensation erfolgt Abspaltung der 2-Chlor-Pheny(gruppe durch Behandeln mit 
Oxlmatreagenz (vgl. Tetrahedron Let. 1978, 2727), 
3 ml, fur 24 h, Abspaltung vom Trager und Entfernung der N-Arylgruppen durch Behandtung mit 
10 konzentriertem wassrigem Ammoniak, 12 h bei 50° C. Nach dem Einengen und 5-facher Extraktion mit je 5 ml 
CHCI3 wird die wSssrige Ldsung durch Anionaustauschchromatographie an DEAE-Cellulose in der ublichen 
Weise gereinigt (vgl. Uebigs Ann. 1978, 839 und Tetrahedron Let. 1983. 747). 

Das gereinigt e Material wird in ubticher Weise durch Polyacrylamidgelelektrophorese (20 %, 7M Harnstoff) 
und Vergleich mit einem Homo-oligo-dT-Kettenl5ngenstandard und durch Sequenzierung entweder nach 
15 Maxam-Gilbert oder nach der "mobility shhY'-Methode charakterislert. 



Ligation: 

20 

Um das Ligationssubstrat zu erhalten, wird pBR 322 mit Bal I (TGG1CCA) in ubltcher Weise linearislert und 
auf diese Weise die DNS mh dem stumpfen ^c-Ende versehen. Die Ligation erfolgt in 66 mM Tris-HCI (pH 7,6), 
6,6 mM MgC! 2 , 10 rnM Drthiothreitol, 0,4 mM ATP und 4 Einheiten T4-Ugase pro 20 ui Reaktionsvolumen. Der 
Linker wird im 50-fachen OberschuB uber die Termini verwendet. Die Ligationsdauer betragt 24 h bei 10°C. 
25 AnschlieBend wird mit Bam HI in der ublichen Weise inkublert; die entstandanen Bam Hl-kohSsiven Enden 
werden In gleicher Weise wie oben angegeben, jedoch mit lediglich 0,02 Einheiten T4-Ligase, pro 20 u.1 ligtert. 
Die Reaktionsdauer betragt 1 h bei 22° C. 

Die Agarosegetelektrophorese zeigt Umwandlung der linearen pB R 322-DNS in circulate DNS unter 
Lig8tionsbedingungen, unter denen nur kohasive, nicht jedoch stumpfe Enden ligiert werden. 





Tabelle 1 














35 


TTTT 
TTTA 
TTTC 
TTTG 


AAAT 
AAAA 
AAAC 
AAAG 


CCCT 
CCCA 
CCCC 
CCCG 


GGGT 
GGGA 
GGGC 
GGGG 


TCAT 
TCAA 
TCAC 
TCAG 


TCGT 

TCGT 
TCGG 


TACT 
TACA 
TACC 
TACG 


40 


TTCT 
TTCA 
TTCC 
TTC6 


AATA 
AATC 
AATG 


CCTT 
CCTA 
CCTC 
CCTG 


GGTT 
GGTA 
GGTC 
GGTG 


TGCT 

TGCC 
TGCG 


TGAT 
TGAA 
TGAC 
TGAG 


TAGT 
TAGA 
TAGC 
TAGG 


45 


TTAT 

TTAC 
TTAG 


AACT 
AACA 
AACC 
AACG 


CCAT 
CCAA 
CCAC 
CCAG 


GGAT 
GGAA 
GGAC 
GGAG 


CTAT 
CTAA 
CTAC 


CTGT 
CTGA 
CTGC 
CTGG 


GATT 
GATA 

GATG 


50 


TTGT 
TTGA 
TTGC 
TTGG 


AAGT 
AAGA 
AAGC 
AAGG 


CCGT 
CCGA 
CCGC 


GGCT 
GGCA 

GGCG 


CATT 
CATA 
CATC 


CAGT 
CAGA 
CAGC 
CAGG 


GACT 
GACA 
GACC 
GACG 




TATT 


ATAA 


CTCT 
CTCA 


GTGT 
GTGA 


CGTT 
CGTA 


CGAT 
CGAA 





60 



65 
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TATC 
TATG 


ATAC 
ATAG 


CTCC 

CfCG 


GTGC 
GTGG 


CGTC 
CGTG 


CGAC 
CGAG 


> 


5 


TCI 1 
TCTA 
TCTC 
TCTG 


AOAT 

ACA1 
ACAA 
ACAC 
ACAG 


CACA 
CACC 
CACG 


Unu 1 

GAGA 
GAGC 
GAGG 


Mlwl 

ATCA 
ATCC 
ATCG 


ATRT 

ATGA 
ATGC 
ATGG 




to 


TGTT 
TGTA 
TGTC 
TGTG 


AGAT 
AGAA 
AGAC 
AGAG 


CGCT 
CGCA 
CGCC 


GCGT 
GCGA 

GCGG 


ACTT 
ACTA 
ACTC 
ACTG 


ACGA 
ACGC 
ACGG 




ts 


TAAT 
TAAA 
TAAC 
TAAG 


ATTT 
ATTA 
ATTC 
ATTG 


CTTT 
CTTA 
CTTC 
CTTG 


GTTT 
GTTA 
GTTC 
GTTG 


AGTT 
AGTA 
AGTC 
AGTG 


AGCA 
AGCC 
AGCG 




20 


TCCT 
TCCA 
TCCC 
TCCG 


ACCT 
ACCA 
ACCC 
ACCG 


CAAT 
CAAA 
CAAC 
CAAG 


GAAT 
GAAA 
GAAC 
GAAG 


GTCT 
GTCA 
GTCC 
GTCG 


GTAT 
GTAA 

GTAG 




25 


TGGT 
TGGA 
TGGC 
TGGG 


AGGT 
AGGA 
AGGC 
AGGG 


CGGT 
CGGA 
CGGC 
CGGG 


GCCT 
GCCA 
GCCC 
GCCG 


GCTT 
GCTA 
GCTC 
GCTG 


GCAT 
GCAA 
GCAC 
GCAG 



30 

Paterrtanspruche 

1. Verfahren zur definierten Verknupfung doppelhelikaler DNA-Fragmente uber kohasive En den mit den 
Schritten: 

35 

1. Umsetzung ernes ersten DNA-Fragmentes an dessen stumpfen Ende mit einer kurzen. beidseitig 
stumpf en doppelhelikalen Linker-DN A in Gegenwart von Ugasen. 

X Spaltung der so erhaltenen DNA im Bereich der Linkersequenz unter Ausbildung des eine Sequenz 
von 1-6 Nucleotide aufweisenden kohdstven Endes und 
40 3. Verknupfung der so erhaltenen, das kohasive Ende aufweisenden DNA mit einem ein kohasives Ende 

aufweisenden zweiten DNA-Fragment in Gegenwart von Ugasen, 

wobei die kohasive n Enden der ersten und zweiten DNA-Fragmente zueinander komplementar sind, dadurch 
gekennzeichnet, daB man als Linker-DNA ein in sich selbst komplementares, unter Ugationsbedingungen als 
45 Doppelhelix vorfiegendes Oligonucleotid der allgemeinen Forme! I 

(5') R* - R 1 - (X) n - R2 (3') (■) 

in der R 1 und R 2 von links nach rechts gelesen tdentische, in sich selbst komplementare Tetradesoxy- Oder 
50 Monoribotridesoxynucleotidsequenzen a us der Gruppe der Sequenzen der Forme I II 



55 



60 



65 
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(5')A-A-nr<3-) 

TTAA* 
A*TAT 
TATA* 

5 G'GCC* 

C*CGG" 

G'CGC* (II) 

C*GCG* 

G*ATC* 

10 G*TAC* 

C*ATG* 
C # TAG* 
A*CGT 
A*GCT* 

15 T'CGA* 

TGCA* 

in denen A, C. G und T bzw. A*. C*, G' und T* Adenin-, Cytosin-. Guanin bzw. Thymidinnucleotide sind, wobei 
A*. C*, G* und T* entweder das 5' bzw. 3*-endstandige Desoxy- Oder das 5' bzw. 3'-endstandige Ribonucleotid 
20 bedeuten und das Ribothymidinnucleotid T* durch das Ribouridinnucleotid ersetzt sein kann, 
Oder 

R 1 elne Pentadesoxy- Oder Monoribotetradesoxynucleotidsequenz aus der Gruppe der Sequenzen der 
Formel III 

25 (5')A*ANTT(3'J 

T-TNAA* 
ATNAT 
TANTA* 
G"GNCC* 

30 C*CNGG" 

G-CNGC* 
C-GNCG* 

G*ANTC* (III) 
G'TNAC* 

35 C*ANTG* 

C"TNAG* 
A*CWGT # 
A - GNCT 
TCNGA* 

40 TGNCA* 

bedeutet, wobei A, C, G und T bzw. A\ C\ G* und T wie oben definiert sind und N eines der Nucleotide A, T. 
C oder G bedeutet, 

und R2 elne Pentadesoxy- Oder Monoribotetradesoxynudeotidsequenz aus der Gruppe der Sequenzen der 
45 Formal IV 

(5')A # ANTT(3') 
TTN'AA* 
A'TN'AT 
VANTA* 

SO G'GN'CC* 

C'CN'GG* 

G'CN'GC* (IV) 

C*GN'CG* 

G"ANTC* 

55 GTN'AC* 

C'ANTG* 
C'TN'AG* 
A*CN'GT* 
A-GN'CT 

60 TCN'GA* 

TGN'CA* 

bedeuten, wobei A, C, G und T bzw. A*, C\ G" und T* wie oben definiert sind, N* das zu N komplementare 
Nucleotid A, T, C oder G 1st und die Sequenzen der Gruppen R 1 und R 2 bis auf die zueinander komplementare n 
65 Nucleotide N und N\ von links nach rechts gelesen, identisch sind. 
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Oder 

R 1 elne der durch Kombination der vier Nucleotide A, C, G und T m6g lichen, nicht in sich selbst 
komplementaren Tetra- oder Penta nucleotidsequenzen der Formeln V oder Vt oder eine in sich selbst 
kompfementere oder nicht in sich selbst komplementare Hexanucleotidsequenz der Form el VII 

(5')N1-N 2 -N*-N*(3') 

(V) 

(5')Nl-N2-N3-N 4 -N5(3') (VI) 
(5')Ni-N2-N*-N*-NB-N*(3 r ) (VII) 



bedeuten, 

wobei H\ N*. N3, N 4 , N 6 und N 8 eins der Nucleotide A, T, C oder G ist. und R 2 eine zu R* spiegelbiidlich 
15 komplementare Tetra-, Penta- bzw. Hexanucleotidsequenz der Formeln V, VI bzw. VII mit den oben 
angegebenen Bedeutungen fur N 1 , N 2 , N 3 , N 4 , N 5 und N 6 ist und entweder R 1 eine Monoribotridesoxy-, 
Monoribotetradesoxy- oder Monoribopentadesoxynucleottdsequenz und R 2 eine Tetradesoxy-, Pentadesoxy- 
oder Hexadesoxynucleotidsequenz oder R l eine Tetradesoxy-, Pentadesoxy- oder 
Hexadesoxynucleotidsequenz und R 2 eine Monoribotridesoxy-, Monoribotetradesoxy- oder 
20 Monoribopentadesoxynucleotidsequenz ist, oder R 1 eine zu R 2 spiegelbiidlich komplementare 
Monoribotridesoxy-, Monoribotetradesoxy- oder Monoribopentadesoxysequenz ist, wobei sich das 
Ribonucleotid am 6'- oder 3'-Ende von R T oder am 5' oder 3'-Ende von R 2 befindet, und wobei 8'- bzw. 3 - 
standiges Ribothymidin durch Ribouridin ersetzt sein kann, 

X ein Oligonucleotid aus der Gruppe der Sequenzen der Formel VIII 

25 

(5')C'G*(3 r ) 
G # C* 
T*A* 
A*T- 

30 G'CGG* (VIII) 

G*GCC" 
A* ATT* 
T-TAA* 
CTCCGGG* 

35 G'GGCCC- 

A'AATTT 
T*TTAAA* 

in denen A, C, G und T bzw. A*, C*, G* und T* wie oben def iniert sind, und 
40 n eine ganze Zahl von 1-6 bedeutet, jedoch mit den Ausnahmen 

1. J wenn Rt - R — CATG kann X nur AT, TA, GC oder CG bedeuten und 

2. ) wenn R' - R 2 - CCGG kann X nur CG. GC, AATT oder TTAA bedeuten, 

45 verwendet, 

und die Spaltung der so erhattenen doppelhelikalen DNA lm Unkerbereich bet Nucleotidsequenzen, die 
keine Ribonucleotide enthaften, in an sich bekannter Weise mit einer fur das zu erzeugende kohdsive Ende 
spezischen Restriktionsendonudease der Klassen 11 oder III und bei Ribonucleotide enthaltenden 
Nucleotidsequenzen mit Basen oder Ribonucleasen vomimmt. 
50 2. Verfahren nach Anspruch 1, dadurch gekennzelchnet, daB man das ein kohasives Ende aufweisende erste 
DNA-Fragment vor der Verknupfung mit dem zweiten DNA-Fragment mit einer an sich bekannten, kohasive 
Enden unterschiedlicher Restriktionsspezifitat aufweisenden Adapter-DMA umsetzt. 

3. Unter Ugationsbedingungen doppelhetikale Linker-DNA der Formel I 

55 (B')Ri - (X),, - R 2 (3') (I), 

m der R 1 . R 2 , X und n wie oben def iniert sind. jedoch mit den Ausnahmen 

1.) wenn R 1 — R2 - CATG kann X nur AT, TA, GC oder CG bedeuten und 
60 2.) wenn R 1 R* - CGGG kann X nur CG, GC, AATT oder TTAA bedeuten. 



65 
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Claims 

1. Process for the defined linkage of double-helical DNA fragments via cohesive ends, with the following 
steps: 

5 

1. Reaction of the blunt end of a first DNA fragment with a short double-helical linker DNA. which is 
blunt et both ends, in the presence of ligases, 

2. Cleavage of the DNA thus obtained in the region of the linker sequence, with the formation of a 
cohesive end having a sequence of 1 - 6 nucleotides, and 

10 3. Linkage of the DNA thus obtained, which has the cohesive end. with a second DNA fragment having a 

cohesive end, in the presence of ligases, 

the cohesive ends of the first and second DNA fragments being complementary to one another, characterised 
in that the linker DNA used Is a self-complementary oligonucleotide which is in the form of a double helix 
15 under ligation conditions and has the general formula I 

(5TRi-(X) n -R*{3') (0 

in which R 1 and R 2 , reading from left to right, are identical self -complementary tetradeoxy nucleotide or 
20 monoribotrideoxynucleotide sequences from the group of sequences of the formula II 

(5')A*ATT(3'J 
TTAA* 
A-TAT- 

25 TATA* 

G*GCC* 
C"CGG- 

G'CGC* (»} 
C*GCG* 

30 G-ATC* 

GTAC- 
CATG* 
C-TAG* 
A*CGT* 

35 A-GCT- 

T*CGA- 
TGCA* 



in which A, C, G and T r and A*, C\ G' and T are adenine, cytosine, guanine and thymidine nucleotides 
40 respectively. A*, C\ G* and T* denoting either the 5'- or 3'-terminal deoxynucleotide or the 5'- or 3'-terminal 
ribonucleotide, and it being possible for the ribothymidine nucleotide T* to be replaced by the ribouridine 
nucleotide, 
or 

Rt denotes a pentadeoxynucleotide or monoribotetradeoxynucleotide sequence from the group of 
45 sequences of the formula lit 



{5')A*ANTT(3') 
TTNAA* 
ATNAT* 

50 TANTA- 

G*GNCC 
C'CNGG* 
G'CNGC* 
C-GNCG* 

55 G'ANTC" (l») 

G'TNAC* 
C*ANTG* 
C'TNAG* 
A'CNGT- 

60 A-GNCT* 

TCNGA* 
"PGNCA* 



A, C, G and T. and A*, C*, G* and T" being defined as above, and N denoting one of the nucleotides A, T. C or 
65 G, and R 2 denotes a pentadeoxynucleotide or monoribotetradeoxynucleotide sequence from the group of 
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sequences of the formula IV 

(5')A*ANTT*(3) 
T'TN'AA" 

5 A*TN'AT* 

T"ANTA- 
G*GN'CC* 
(TCNGG* 

G*CN'GC* (IV) 
10 C-GN'CG* 

G-ANTC 
GTN'AG- 
C'ANTG* 
C-TN'AG* 

15 A*CN'GT* 

A-GN'CT* 
T-CNGA* 
T-GN'CA* 

20 A, C . G and T, and A", C\ G" and T* being defined as above, N' being the nucleotide A, T, C or G which is 
complementary to N, and the sequences of th groups R 1 and R 2 , read from left to right, being identical apart 
from the nucleotides N and 1ST which are complementary to one another, 
or 

R 1 denotes one of -the tetranucleotide or pentanucleotide sequences possible by combination of the four 
25 nucleotides A, C, G and T, which is not self-complementary, of the formulae V or VI. or a hexanucleotide 
sequence of the formula VII which is self-complementary or is not self-complementary. 

(6')N1-N2-N3-N4(3') rv) 
30 (5')Ni-N2-N^N«-N5(3') (VI) 
(5')N1-N*-N3-N*-N5.N6(3') (VII) 

ISP, N 2 N3 N*. MS. and N& being one of the nucleotides A, T, C or G, and R 2 being a tetranucleotide, 
35 pentanucleotide or hexanucleotide sequence which is reverse complementary to R 1 , and has the formulae V, VI 
or VII. with the abovementioned meanings for N\ N 2 M 3 , N 4 . N 5 and N 6 . and either R 1 is a 
monoribotrideoxynucleotide, monoribotetradeoxynucleotide or monortbopentadeoxynucleotide sequence and 
R 2 Is a tetrad eoxy nucleotide, pentadeoxynucleotide or hexadeoxy nucleotide sequence, or R 1 is a 
tetradeoxynucleotide, pentadeoxynucleotide or hexadeoxynucleotide sequence and R 2 is a 
40 monoribotrideoxynucleotide. monoribotetradeoxynucleotide or monoribopentadeoxynuc leotide sequence, or 
R 1 is a monoribotrideoxynucleotide. monoribotetradeoxynucleotide or monortbopentadeoxynucleotide 
sequence which is reverse complementary to R 2 , the ribonucleotide being located at the 5'- or 3*-end of R 1 or 
at the 5'- or 3'-end of R 2 , and it being possible for 5'- or 3'-ribothymidine to be replaced by ribouridine. 
X denotes an oligonucleotide from the group of sequences of the formula VIII 

45 

(5')C-G"(3') 
G'C* 
T*A* 

A*r 

50 G*CGG* (VIII) 

G*GCC* 
A'ATT* 
T*TAA* 
C'CCGGG* 

55 G*GGCCC* 

A'AATTT* 
TTTAAA" 

in which A. C, G and T. and A*. C*. G* and T* are defined as above, and n denotes an integer from 1 to 5. but 
60 with the exceptions 

1) if R 1 ~R 2 - CATG X can only mean AT. TA, GC or CC and 

2) if Ri -R 2 - CCGG X can only mean CG. GC. AATT or TTAA 

65 and the cleavage in the linker region of the double-helical DNA thus obtained is carried out for nucleotide 
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sequences which do not contain ribonucleotides, in a manner known per se using a restriction endonuclease of 
classes II or III which is specific for the cohesive, end to be produced, and, for nucleotide sequences containing 
ribonucleotides, using bases or ribonucleases. 

2. Process according to claim 1, characterized in that the first DNA fragment having a cohesive end is, before 
5 linkage with the second DNA fragment, reacted with an adapter DNA which is known per se and has cohesive 

ends of different restriction specificity. 

3. Linker DNA which is double- helical under ligation conditions and has the formula I 

<5')R'-(X)„-R*{3') (I) 

to 

in which R 1 , R 2 , X and n are as defined above, but with the exceptions 

1) if Rt _ R2 « CATG X can only mean AT, TA. GC or CG and 

2) if R1 « R2 - CCGG X can only mean CG, GC, AATT or TTAA 

15 



Revendicattons 



20 



1. Precede pour la liaison definte de fragments d'ADN a double helice par des extremites cohesives, 
comportant les eta pes suivantes: 

1. reaction d'un premier fragment d'ADN, en ses extremites tronquees, avec un ADN linker court, a 
double helice, Hon que des deux cotes, en presence de ligases, 
25 2. coupure de I'ADN alnsi obtenu dans la region de la sequence du linker, avec formation de Pextremite 

cohesive presentant une sequence de 1 - 6 nucleotides, et 

3. liaison de I'ADN ainsi obtenu, presentant I'extremite cohesive, avec un second fragment d'ADN 
presentant une extremite cohesive, en presence de ligases, 

30 les extremites cohesives du premier fragment d'ADN et du second etant complementaires Tune de I'autre, 
caracterise par le fait qu'on utilise en tant qu'ADN linker un oligonucleotide comptementaire en soi, present 
sous forme de double helice dans des conditions de ligature, correspondent a la formula generate I 



35 



(5')R'-(X) n -R*(3') (I) 

dans laquelle R 1 et R 2 represented des sequences tetradesoxy- ou monoribotridesoxynucleotidiques 
complementaires en soi, identiques lues de gauche a droite, choisies parmi les sequences de formule II 



(5')A # ATr{3') 
40 T*TAA* 

A'TAT* 
T*ATA* 
G-GCC* 
C*CGG # 

45 G*CGC^ (II) 

CTGCG- 
G-ATC* 
G'TAC" 
C # ATG* 

50 C*TAG" 

A*CGT* 

A-Gcr 

TCGA* 
T*GCA* 

55 

dans lesquelles A. C, G et T ou respectivement A*. C\ G* et T* sont des nucleotides a adenine, a cytosine, a 
guanine ou a thymidine. A", C*, G* et T* representent soit le desoxy ribonucleotide en terminaison 5' ou 3', sort 
le ribonucleotide en terminaison 5' ou 3', et le ribonucleotide a thymidine T* pouvant etre rem place par le 
ribonucleotide a uridine, 
60 ou 

R 1 represente une sequence pentadesoxy- ou monoribotetradesoxynucleottdique chotsie parmi les 
sequences de formule HI 
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(5')A-ANTT(3') 
TTNAA* 
A'TNAT* 
T*ANTA* 

5 G'GNCC* 

C # CNGG* 
G'CNGC - 
CGNCG* 

G*ANTC* (HI) 
10 G*TNAC* 

C*ANTG* 
C'TNAG* 
A*CNGT* 
A*GNCT* 

15 T'CNGA* 

T*GNCA* 

dans lesquelles A, C, G et T ou, respectivement, A\ C*. G* et T* sont tels que definis plus haul, et N represents 
un des nucleotides A, T. C ou G, et 
20 R 2 represents une sequence pentad esoxy- ou monoribotetradesoxynucleotidique choisie parmi les 
sequences de formule IV 

(5)A*ANTr(3*) 
T*TN'AA* 

25 A'TN'AT* 

TANTA* 
G*GN r CC" 
C*CN'GG - 

G'CN'GC- (IV) 
30 C'GN'CG" 

G*ANTC* 
G'TN'AC* 
C*AN*TG* 
CTN'AG* 

35 A'CN'GT* 

A-GNXT* 
rCN'GA* 
T*GN'CA* 

40 A, C, G et T ou, respectivement, A*, C*\ G" et T* etant te(s que definis plus ha tit, N' etant te nucleotide A, T, C 
ou G complernentaire de N, et les sequences des groupes R 1 et R 2 etant identiques, lues de gauche a droite. 
jusqu'aux nucleotides N et N' complementalres Tun de 1'autre, 
ou 

R 1 represente une des sequences tetra- ou pentanucleotidiques de formules V ou VI, non complementaires 
45 en soi, possibles par combinaison des quatre nucleotides A, C, G et T, ou une sequence hexanucleotidique 
complernentaire en soi ou non complernentaire en soi, de formula VII 

(5')N1-N 2 -N3-N«(3') (V) 

60 [V)H*-H*-US-Ufi-U*{y) (VI) 

N*, N 2 , N*. N« N 5 et N 8 etant un des nucleotides A, T, C, ou G f et R 2 etant une sequence tetra-, penta- ou 
55 hexanucleotidique complernentaire en tant qu'image de R 1 dans un miroir, de formules V, VI ou VII, avec les 
significations donnees plus haut pour IsP, N a , N 3 , N 4 , N 5 et N 8 , et soit R 1 etant une sequence 
monorsbotridesoxy-, monoribotetradesoxy- ou monoribopentadesoxynucleotidique, et R 2 etant une sequence 
tetra desoxy-, pentade esoxy- ou hexadesoxynucleotidique, soit R 1 etant une sequence tetra desoxy-. 
pent ad esoxy- ou hexadesoxynucleotidique, et R 2 . etant une sequence monoribot rid esoxy-, 
60 monoribotetradesoxy- ou monoribopentadesoxynucleotidique, soit R 1 etant une sequence monoribotridesoxy-. 
monoribotetradesoxy- ou monoribopentadesoxy complernentaire en tant qu'image de R 2 dans un miroir, le 
ribonucleotide se trouvant a I'extremite 5' ou 3' de R* ou a I'extremite 5* ou 3* de R 2 . et la ribothymidine se 
trouvarrt en 5' OU 3* pouvant etre remplacee par la ribo-uridine; 
X represente un oligonucleotide chotsi parmi les sequences de formule VIII 
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G*C* 
T*A* 
A-T- 

5 G'CGG* (VIII) 

G'GCC- 

A*ATT* 

TTAA* 

C^CCGGG- 

10 G'GGCCC- 

A*AATTT* 
TTTAAA* 



dans lesqueltes A, C. G et T ou, respectivement, A*. C\ G* et T* sont tels que def tnis plus haul, et 
15 n represents un nombre entier valant de 1 a 5, avec toutefoss les restrictions sutvantes: 

1) lorsque R 1 — R 2 _ CATG, X ne peut representor que AT, TA, GC ou CG, et 

2) lorsque R 1 — R 2 - CCGG, X ne peut representor que CG, GC, AATT ou TTAA, 

20 et on effectue la coupure de I' ADN a double helice ainsi obtenu, dans la region du linker, dans la cas de 
sequences nucleotidiques qui ne contiennent pas de ribonucleotides, d'une facon connue en soi, avec une 
endonuclease de restriction de la classe II ou III, specifique pour I'extremite cohesive a produire, et dans le cas 
de sequences nucleotidiques contenant des ribonucleotides, avec des bases ou des ribonucleases. 

2. Procede selon la revendication 1, caracterise par le fait que I'on fait reaglr un premier fragment d'ADN 
25 presentant une extremite cohesive, avant la liaison avec le second fragment d'ADN, avec un ADN de 

raccordement (AON adapter) connu en soi, presentant une specif icite de restriction distincte des extre mites 
cohesives. 

3. ADN linker a double helice dans des conditions de oligature, de formule I 

30 (5')Ri-(X) n -RM3'} (2) 

dans laquelle R 1 , R 2 , X et n sont tels que definis plus haut, avec toutefois les restrictions suivantes: 

1) lorsque Rl — R 2 = CATG, X ne peut representor que AT, TA, GC ou CG, et 
35 2) lorsque R 1 «=* R 2 CCGG, X ne peut representer que CG. GC, AATT ou TTAA. 
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